بهبود عملکرد روش hmm در دیکدر atp گفتار پیوسته فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
- نویسنده ساناز علیزاده
- استاد راهنما ابوالقاسم صیادیان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1385
چکیده
تغییرات مشخصه آکوستیکی واج ها تحت متن های مختلف موجب شده است که در پیاده سازی سیستم-های بازشناسی گفتار، از واحد های گفتاری وابسته به متن مانند هجا و نیم هجا که اثرات آواهای مجاور را نیز در نظر می گیرند، استفاده شود. با توجه به اینکه زبان فارسی از دسته زبانهایی می باشد که دارای ساختار هجایی ساده ای است، در این تحقیق واحد گفتاری نیم هجا برای مدلسازی طیفی مورد توجه قرار گرفته است و آزمون های متعددی برای تصدیق مطلب فوق در طی انجام پروژه صورت گرفته است. به علت فقدان پایگاه داده فارسی مبتنی بر نیم هجا، تلاش زیادی جهت طراحی متن و جملات مورد نیاز برای پایگاه داده در طی این تحقیق انجام پذیرفته است و داده های گفتاری مربوط به دو گوینده زن و دو گوینده مرد برای ارزیابی مدلها بیان و ضبط شده و به صورت با سرپرستی در سطح واکه و نیم هجا برچسب زده شده است. با توجه به اینکه تشخیص نیم هجاها، ابتدا از آشکارسازی سکوت و واکه آغاز می گردد، در اولین قدم تمام توجه ما به آشکارسازی واکه ها معطوف شده است. در بازشناسی واکه ها، از ترکیب مدل آماری مارکوف پنهان با پارامترهای آکوستیکی مانند انرژی میانگذر استفاده شده است. در این پروژه محدوده واکه ها با بهره مندی از ویژگی های مدل آکوستیکی مانند سادگی، سرعت و ناوابسته بودن آن به گوینده ها، مشخص شده است. سپس با ترکیب نتایج حاصل از پارامترهای آکوستیکی و مدل آماری مارکوف پنهان به نتایج بسیار مناسبی در بازشناسی واکه ها دست یافتیم. در این پروژه در بهترین حالت ها، در گفتار پیوسته به خطای 98/8% و در گفتار گسسته به خطای 87/2% دست یافتیم.
منابع مشابه
بهبود عملکرد مدل ماشین های بردار پشتیبان در دیکدر atp گفتار پیوسته فارسی
درسیستم های بازشناسی گفتار انتخاب واحد گفتاری مناسب، از اهمیت ویژه ای برخوردار است. جهت انتخاب واحد آکوستیکی مناسب، در نظر گرفتن ساختار و ویژگی های زبان مورد استفاده، بسیار مهم است. با توجه به این که ساختار هجایی زبان فارسی تقریبا همانند زبان های هندی، چینی و ژاپنی ساده و محسوس است، در این تحقیق، واحد زیر کلمه نیم هجا به عنوان واحد آکوستیکی مناسب در زبان فارسی مورد توجه ما قرار گرفته است. با تو...
15 صفحه اولمعرفی شبکه های عصبی پیمانه ای عمیق با ساختار فضایی-زمانی دوگانه جهت بهبود بازشناسی گفتار پیوسته فارسی
In this article, growable deep modular neural networks for continuous speech recognition are introduced. These networks can be grown to implement the spatio-temporal information of the frame sequences at their input layer as well as their labels at the output layer at the same time. The trained neural network with such double spatio-temporal association structure can learn the phonetic sequence...
متن کاملبررسی تاثیر سرعت گفتار روی زمان شروع واک (وی اُتی) همخوان های انسدادی فارسی معیار در گفتار پیوسته
مطالعۀ حاضر به بررسی تأثیر سرعت گفتار روی زمان شروع واک (ویاُتی) همخوانهای انسدادی واکدار /b, d, ɟ/ و بیواک /p,t,c/ زبان فارسی معیار میپردازد. به این منظور، طی آزمون تولیدی تعداد 8 جمله حاوی کلمات آزمایش، هر کدام 3 مرتبه توسط 24 شرکت کننده (17 شرکت کنندۀ مؤنث و 7 شرکت کنندۀ مذکر) در سرعتهای متفاوت تولید شدند. مقادیر ویاُتی برای همخوانهای انسدادی واکدار و بیواک به تفکیک موقعیت در واژه (...
متن کاملبهبود عملکرد سیستم بازشناسی گفتار پیوسته بوسیله ویژگیهای استخراج شده از مانیفولدهای گفتاری در فضای بازسازی شده فاز
The design for new feature extraction methods out of the speech signal and combination of their obtained information is one of the most effective approaches to improve the performance of automatic speech recognition (ASR) system. Recent researches have been shown that the speech signal contains nonlinear and chaotic properties, but the effects of these properties are not used in the continuous ...
متن کاملبازشناسی احساس از روی گفتار پیوسته فارسی
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...
تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانهگذاری ضرایب موجک و نرمسازی فازیِ تابع انرژی
امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمهای هر روز بیشتر مورد توجه قرار میگیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023